{
 "cells": [
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "##### 1.如果你在相同训练集上训练5个不同的模型，他们都有95%的准确率，那么你是否可以通过组合这些模型来得到更好的结果？如果可以那怎么做呢？如果不可以请给出理由。\n",
    "\n",
    "可以通过投票分类器来提高准确率，从而获得更好的结果。\n",
    "\n",
    "投票方法：\n",
    "\n",
    "1、硬投票：每个模型都输出它认为最可能的类别， 投票模型从中选出模型输出最多的类别\n",
    "\n",
    "2、软投票：每个模型输出一个所有类别的概率，投票模型取其加权平均，得到一个最终的概率"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "##### 2.软投票和硬投票分类器之间有什么区别?\n",
    "\n",
    "1、硬投票：每个模型都输出它认为最可能的类别， 投票模型从中选出模型输出最多的类别\n",
    "\n",
    "2、软投票：每个模型输出一个所有类别的概率，投票模型取其加权平均，得到一个最终的概率"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "##### 3.是否有可能通过分配多个服务器来加速bagging集成系统， pasting集成系统，boosting集成系统，随机森林或stacking集成系统的训练？\n",
    "\n",
    "分配多个服务器可以加速bagging集成系统，pasting集成系统，随机森林的训练，因为他们的子模型是并行处理的。\n",
    "\n",
    "bossting集成系统和stacking集成系统是无法进行加速的，他们的每个子模型都依赖于前一个子模型。"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "##### 4.out-of-bag 评价的好处\n",
    "\n",
    "可以让模型有更多的数据提供训练，从而提高集成系统的准确率。"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "##### 5.是什么使Extra-Tree 比规则随机森林更随机？ 这个额外的随机有什么帮助呢？那这个Extra-Tree比规则随机森林谁更快呢？\n",
    "\n",
    "Extra-Tree 又称极端随机树。 在每个节点分裂时只考虑随机特征集上的特征，相比于找到更好的特征,extra-tree通过使用随机阈值使树更加随机。\n",
    "\n",
    "因为在每个节点上找到每个特征的最佳阈值是生长的最耗时的任务之一，所以会加快决策树的训练速度。\n",
    "\n",
    "所以Extra-Tree训练的时候要比随机森林更快，预测的时候确实相同的速度。\n"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {},
   "outputs": [],
   "source": []
  }
 ],
 "metadata": {
  "kernelspec": {
   "display_name": "Python 3",
   "language": "python",
   "name": "python3"
  },
  "language_info": {
   "codemirror_mode": {
    "name": "ipython",
    "version": 3
   },
   "file_extension": ".py",
   "mimetype": "text/x-python",
   "name": "python",
   "nbconvert_exporter": "python",
   "pygments_lexer": "ipython3",
   "version": "3.7.4"
  }
 },
 "nbformat": 4,
 "nbformat_minor": 2
}
